Národní úložiště šedé literatury Nalezeno 6 záznamů.  Hledání trvalo 0.00 vteřin. 
Shlukování textových dat
Leixner, Petr ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce)
Proces shlukování textových dat slouží pro analýzu, navigaci a strukturování velkých kolekcí textů nebo hypertextových dokumentů. Úkolem shlukování je rozklad množiny dokumentů do shluků na základě jejich podobnosti. Nejznámější metody z této oblasti dolování však neřeší specifické problémy textového shlukování, jako vysokou dimenzionalitu vstupních dat, velmi velkou velikost databází a srozumitelnost popisu shluků. Tato práce se zabývá uvedenou problematikou a popisuje moderní metodu shlukování textových dat založenou na použití frekventovaných množin termů, která se svým přístupem snaží řešit nedostatky jiných shlukovacích metod.
Metody extrakce informace z textových dokumentů
Sychra, Tomáš ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce)
Získávání znalostí z textových dokumentů představuje podmnožinu obecného získávání dat - dataminingu. Textové dokumenty však mají vlastnosti odlišné od běžných databází. Tato práce obsahuje přehled metod použitelných pro dolování informací z textů. Nejpoužívanější dolovací úlohou je klasifikace. Popíši možné přístupy při klasifikování dokumentů. V závěru představím algoritmus Winnow, který by měl při klasifikaci dosahovat dobrých výsledků v porovnání s ostatními algoritmy. Součástí práce je i popis implementace algoritmu Winnow a přehled dosažených výsledků.
Certifikovaná metodika: Metodika neinvazivního průzkumu knihovních jednotek
Vávrová, Petra ; Neoralová, Jitka ; Novotná, Dana ; Součková, Magda ; Kazanskii, Andrei ; Blecha, Tomáš ; Popelková, Daniela ; Kohoutová, Kristina ; Kocour, Vladimír
Cílem předkládané metodiky je představení vybraných technologií a postupů pro průzkum knihovních dokumentů, u kterých je předpokládán výskyt sekundárně použitých textových nosičů (tzv. zlomků), historicky cenných fragmentů poškozených nebo odstraněných textů a provenienčních znaků, vnitřních defektů knižní vazby nebo napadení hmyzem.
Plný text: Stáhnout plný textPDF
Shlukování textových dat
Leixner, Petr ; Burgetová, Ivana (oponent) ; Bartík, Vladimír (vedoucí práce)
Proces shlukování textových dat slouží pro analýzu, navigaci a strukturování velkých kolekcí textů nebo hypertextových dokumentů. Úkolem shlukování je rozklad množiny dokumentů do shluků na základě jejich podobnosti. Nejznámější metody z této oblasti dolování však neřeší specifické problémy textového shlukování, jako vysokou dimenzionalitu vstupních dat, velmi velkou velikost databází a srozumitelnost popisu shluků. Tato práce se zabývá uvedenou problematikou a popisuje moderní metodu shlukování textových dat založenou na použití frekventovaných množin termů, která se svým přístupem snaží řešit nedostatky jiných shlukovacích metod.
Metody extrakce informace z textových dokumentů
Sychra, Tomáš ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce)
Získávání znalostí z textových dokumentů představuje podmnožinu obecného získávání dat - dataminingu. Textové dokumenty však mají vlastnosti odlišné od běžných databází. Tato práce obsahuje přehled metod použitelných pro dolování informací z textů. Nejpoužívanější dolovací úlohou je klasifikace. Popíši možné přístupy při klasifikování dokumentů. V závěru představím algoritmus Winnow, který by měl při klasifikaci dosahovat dobrých výsledků v porovnání s ostatními algoritmy. Součástí práce je i popis implementace algoritmu Winnow a přehled dosažených výsledků.
Automatizace generování stopslov
Krupník, Jiří
Práce se zabývá automatizací generování stopslov, což je jeden ze způsobů předzpracování textových dokumentů. Zkoumá vliv odstraňování těchto slov na výsledky úloh z oblasti dolování znalostí (klasifikace a shlukování). Prvně je zde popsána problematika dolování znalostí z textových dokumentů, včetně rozboru používaných algoritmů. Detailně jsou zde popsány metody pro vytváření doménově nezávislých seznamů stopslov. Dále jsou prezentovány a diskutovány výsledky implementace metod, kterých bylo dosaženo při testování na kolekci rozsáhlých dokumentů ze zkoumané oblasti.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.